reinforcement-learning optimization openai-gym hyperparameters openai gym hyperparameter-optimization rl zoo hyperparameter-tuning hyperparameter-search pybullet stable-baselines Python

reinforcement-learning-an-introduction-chinese:《强化学习

标签： reinforcement-learning reinforcement-learning-algorithms sphinx-doc Python

reinforcement-learning-an-introduction-chinese 本项目为《Reinforcement Learning: An Introduction》（第二版）中文翻译，旨在帮助喜欢强化学习（Reinforcement Learning）的各位能更好的学习交流。中文在线...

reinforcement-learning-an-introduction-master.zip

标签： reinforcement-le

reinforcement-learning

Reinforcement-learning-with-tensorflow-master.zip

标签： Reinforcement-le

Reinforcement-learning-with-tensorflow-master

Multi-Agent-Reinforcement-Learning-Environment_强化学习_multi-agent_

标签：强化学习 multi-agent multiagent missioncgx 强化学习、

多智能体强化学习环境，用于开发强化学习算法

Reinforcement-Learning-CPP:C ++从零开始的强化学习算法

标签： reinforcement-learning qlearning neural-network cpp from-scratch C++

cd Reinforcement-Learning-CPP make ./main 环境代理人必须从A点到达B点。 A..........B 他有两个可用命令： left和righ 。奖励政策如下：如果（代理到达B点）{奖励= 1} 否则{reward = 0} 网络尽管问题很...

reinforcement-learning-robot-in-maze-master.zip_Q-learning_Q-lea

标签： q-learning q-learning_maze reinforcement q_learning_robot reinforcement_robot

Reinforcement learning, a Q learning algorithm, implementation on a robot that tryies to solve randomly created maze and reach the goal. Note that you can run .m files both on Matlab and Octave.

Chrome-Dino-Reinforcement-Learning:Keras中的RL实施

标签： reinforcement-learning q-learning convolutional-neural-networks chrome-dino-game JupyterNotebook

首先克隆存储库$ git clone https://github.com/ravi72munde/Chrome-Dino-Reinforcement-Learning.git Dependencies can be installed using pip install or conda install for Anaconda environment 依存关系 ...

Deep-Reinforcement-Learning-With-Python:使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL，...

标签： reinforcement-learning deep-learning deep-reinforcement-learning openai-gym q-learning dqn policy-gradient a3c ddpg sac inverse-reinforcement-learning actor-critic bellman-equation double-dqn trpo c51 ppo a2c td3 JupyterNotebook

使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL，深度RL，分布式RL，逆RL等关于这本书近年来，随着算法质量和数量的显着提高，《 Python上的动手强化学习》第二版已完全改编为示例丰富的指南，用于学习...

Inverse-Reinforcement-Learning:选定的逆强化学习算法的实现

标签： reinforcement-learning inverse-reinforcement-learning Python

title = { Inverse Reinforcement Learning } , year = 2016 , doi = { 10.5281/zenodo.555999 } , url = { https://doi.org/10.5281/zenodo.555999 } } 实现的算法线性编程IRL。摘自Ng和Russell，2000

Generative-Adversarial-User-Model-for-Reinforcement-Learning-Based-Recommendation-System-Pytorch

标签： reinforcement-learning pytorch generative-adversarial-network gan dqn recommendation-system recommender-system pytorch-implementation dqn-pytorch position-weight-matrix cascading-dqn Python

生成的基于专家的用户模型用于基于学习的推荐系统Pytorch的强化学习基于纸张的下相同的标题剖成Adverserial强化学习基于用户模型实现推荐系统的Pytorch执行此回购包括：必要数据（Yelp评论） ...

reinforcement-learning-papers:我关于强化学习论文的笔记

标签： reinforcement-learning deep-reinforcement-learning papers hierarchical-reinforcement-learning meta-rl

强化学习调查我的笔记（在我看来）是重要的强化学习论文。错字更正，其他要点，论文建议等都非常受欢迎。您可以提出拉取请求，也可以通过einet89 [at] postech.ac.kr给我发送电子邮件。简短摘要 ...

reinforcement-learning-an-introduction-master_Reinforcement_rl_人

标签： Reinforcement rl 人工智能强化学习

reinforcement-learning-an-introduction-master2018第二版配套书各个章节源代码

CS234_Reinforcement-Learning:斯坦福大学CS234冬季课程2019作业

标签： reinforcement-learning stanford cs234 Python

CS234_强化学习斯坦福大学CS234冬季课程2019作业讲课讲座可以在这里看到：讲义可以在这里下载：

cn-reinforcement-learning-ebook-all-chapters.pdf

标签：强化学习 matlab

强化学习MATLAB学习资料

Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习（⅂ꓤ）实施。基于JürgenSchmidhuber发表...

标签： python machine-learning reinforcement-learning machine-learning-algorithms pytorch reinforcement-learning-algorithms continuous-action-space cartpole-environment upside-down-reinforcement-learning discrete-action-space upside-down JupyterNotebook

颠倒的强化学习 Pytorch中的颠倒强化学习（⅂ꓤ）实施。基于JürgenSchmidhuber发表的论文：该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境（该环境的版本）的连续动作空间实现。...

Reinforcement-learning-with-PyTorch-master.zip

Hands-On-Reinforcement-Learning-With-Python-master.zip

标签： Reinforcement

Github资料，并非书籍。 Hands On Reinforcement Learning With Python master

Algorithm-Deep-reinforcement-learning-with-pytorch.zip

标签： Algorithm

Algorithm-Deep-reinforcement-learning-with-pytorch.zip,Pythorch实现DQN、AC、Acer、A2C、A3C、PG、DDPG、TRPO、PPO、SAC、TD3和….,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。

reinforcement-learning-master.zip

标签：强化学习增强学习强化学习算法代码

可以作为配合书籍[Reinforcement Learning: An Introduction (2nd Edition)](http://incompleteideas.net/book/bookdraft2018jan1.pdf) 和课程[David Silver's Reinforcement Learning Course]...

Reinforcement-Learning-Draft 增强学习手稿

标签： Draft Learning-

Reinforcement-Learning-Draft 增强学习手稿高清版 pdf 电子书带目录

awesome-reinforcement-learning-zh-master.zip_Reinforcement_fifty

标签： reinforcement fiftyu83 强化学习matlab 强化学习论文论文代码

本压缩包是强化学习与动态规划的matlab代码，仅供参考，不提供论文代码解读与解惑

reinforcement-learning:基本概念的实施在“强化学习”框架下进行。该项目是CS747中的作业的集合

标签： reinforcement-learning linear-programming thompson-sampling epsilon-greedy ucb policy-evaluation mdps multi-armed-bandits policy-iteration randomised-algorithms reinforcement-learning-excercises kl-divergence markovian-epidemic-processes reinforcement-lea

强化学习此仓库包含“强化学习”框架下处理的基本概念的实现在这里，您将发现对随机多臂匪徒的手臂进行采样的不同算法的实现和比较。每个手臂都从固定的伯努利分布中获得iid奖励。目的是最大程度地减少后悔。...